import numpy as np
from matplotlib import  pyplot as plt

'''
英国和美国各自youtube1000的数据结合之前的matplotlib绘制出各自的评论数量的直方图
'''
us_file_path = "./youtube_video_data/US_video_data_numbers.csv"
uk_file_path = "./youtube_video_data/GB_video_data_numbers.csv"

# t1 = np.loadtxt(us_file_path,delimiter=",",dtype="int",unpack=True)
t_us = np.loadtxt(us_file_path,delimiter=",",dtype="int")
# print("t_us=",t_us)

#取评论的数据  评论的数据 是最后一列
t_us_comments = t_us[:,-1]
print("评论数=",t_us_comments)

#选择比5000小的数据，其它的不要了
t_us_comments = t_us_comments[t_us_comments <= 5000]
print("---2" ,t_us_comments)

# 知道最大值，最小值
print("最大值=%s，最小值=%s"%(t_us_comments.max(), t_us_comments.min()))

d = 50 # 组距 ，两个组之间的距离
bin_nums = (t_us_comments.max() - t_us_comments.min()) //d # 在x轴分为多少组
print("bin_nums=", bin_nums)

#绘图
plt.figure(figsize=(14, 4), dpi=80)

plt.hist(t_us_comments, bin_nums) # Y轴就评论出现的次数

plt.show()
